Навигация по сайту
На Главную 1 семестр 2 семестр 3 семестр Здесь будут другие семестры Обо мне Официальный сайт ФББ МГУ
Для определения таксономии и функции последовательности был использован алгоритм BLASTN пакета BLAST, банк данных nr. Далее идут изображения выдачи алгоритма.
Как видно из рисунков, нашлось много похожих последовательностей. Все они кодируют 18S рибосомальную РНК, так что предполагаем, что и наша последовательнось кодирует 18S rRNA. Также большинство находок (в том числе и две лучшие с покрытием 100% и 97% и идентичностью 98%) принадлежат роду Loxosomella. Для более точного выяснения таксономии по результатам было составленно дерево.
Из дерева видно, что образец действительно принадлежит роду Loxosomella, полная таксономия согласно NCBI: Eukaryota; Metazoa; Lophotrochozoa; Entoprocta; Loxosomatidae; Loxosomella. Точно установить вид невозможно, но можно предположить, что это либо Loxosomella malakhovi, либо Loxosomella varians либо очень близкородственный им вид.
В задании сравнивалась выдача 3 алгоритмов blast: megablast, blastn с стандартными настройками, blastn с чувствительными настройками. для последовательности из задания 1 поиск был ограничен по таксону - не Eucaryota, исключены Models (XM/XP) и Uncultured/environmental sample sequences, максимум 500 находок.
Выдача megablast, параметры по умолчанию, 102 находки
Выдача blastn, параметры по умолчанию, 489 находок
Выдача blastn, длина слова 7 match/mismatch scores 1;-1. 500 находок
Megablast выдал меньше всего результатов, но с максимальным покрытием и идентичностью. Обосновывается тем, что megablast - алгоритм для быстрого поиска очень похожих последовательностей и использует очень длинные слова. Blastn ищет с использованием более коротких слов, поэтому его выдача значительно больше и разнообразнее. При изменении настроек blastn на более чувствительные появляются находки с высоким покрытием и счетом, но низкой идентичностью, ранее они вероятно терялись из-за слишком высокой длины слова по умолчанию.
Повторения исследования для рибосомальной РНК AF114794.1 из Porphyra purpurea с теми же параметрами:
Выдача megablast, параметры по умолчанию, 146 находок
Выдача blastn, параметры по умолчанию, 420 находок
Выдача blastn, длина слова 7 match/mismatch scores 1;-1. 500 находок
В данном задании мы искали гомологи распространенных белков HSP71_YEAST, TBB_NEUCR, TERT_SCHPO у Amoeboaphelidium protococcarum при помощи алгоритма tblastn локального blast-а. пример команды:
tblastn -query HSP71_YEAST.fasta -db X5.fasta -outfmt 7 -out hs_out.out
HSP71_YEAST, шаперон HSP70, белок теплового шока23 находки, большинство со счетом больше 100, лучшая: scaffold-199 score - 920 E-value - 0.0 . Можно предположить наличие гомолога.
выдача алгоритмаTBB_NEUCR, тубулин, белок, участвующий в образовании микротрубочек12 находок, лучшая: unplaced-665 score - 742 E-value - 0.0 . Здесь также есть гомолог.
выдача алгоритмаTERT_SCHPO, теломераза,восстанавливающая длину хромосомы при репликацииЗдесь всего две находки с E-value < 0.5 и они имеют одинаковые координаты в белке. Гомолога этого белка у Amoeboaphelidium protococcarum нет, по находкам можно предположить наличие гомологичного домена, но не более того.
name start end E-value score scaffold-17 320 780 1e-23 108 unplaced-307 320 780 7e-22 102выдача алгоритма
Был выбран контиг unplaced-1071 длиной 86429, поиск производился при помощи алгоритма blastx с ограничением по таксону Fungi.
Как видно из результатов, на данном контиге расположен один ген, АТФ-зависимая ДНК лигаза 1. Все находки имеют идентичность около 60% и E-value 0.0, а покрытие в данном случае не дает понятия о качестве.
Для сравнения были выбраны два штамма молочнокислых бактерий Lactobacillus johnsonii: NCC 533 и Byun-jo-01. Выравниание было полученно алгоритмом blastn. Как видно из карты, примерно половина генома одной из бактерий инвертированна относительно другой. Также в некоторых участках вероятно произошли делеции или инсерции.